Canevas d'analyse rétrospective sans blâme
Ce modèle de post-mortem « sans blâme » vous aide à rassembler des informations sur les incidents survenus en production.
Ce modèle de Post-Mortem « sans reproche » vous aide à réunir des informations sur les incidents survenus en production. Suivre ce processus signifie que les ingénieurs dont les actions ont contribué à un accident peuvent fournir un compte rendu détaillé de :
quelles actions ils ont prises à quelle heure,
quels effets ils ont observés,
les attentes qu'ils avaient,
hypothèses qu'ils avaient faites,
leur compréhension du planning des événements tels qu’ils se sont déroulés.
et qu'elles peuvent donner ce compte-rendu détaillé sans crainte de punition ni de représailles.
Le postmortem Blameless comprend les sections suivantes
Étape 1 : Résumé (prérenseignement avant la réunion)
Un résumé de haut niveau du ticket, se concentrant sur ce qui est connu à ce stade et l'impact ressenti par le client. Gardez cela en une ou deux phrases.
Étape 2 : Planification Approximative (préremplir avant la réunion)
Un planning approximatif du ticket. Selon la vitesse à laquelle le ticket a été traité, ce planning pourrait s’étendre de quelques minutes à quelques heures, voire quelques jours. Si votre principal objectif est d'améliorer les temps de réponse de l’équipe lors des situations d'urgence, vous voudrez que cela se fasse à la seconde près.
Lorsque vous saisissez le planning, assurez-vous d'inclure :
Quand le ticket a été signalé et par qui/quel processus
Quelles actions ont été prises
Quand la communication a été établie au sein de l'équipe et à l'extérieur
Idées de remédiation
Lorsque vous vous réunissez pour discuter du ticket, invitez toutes les personnes qui ont travaillé sur le ticket. Cela inclut l'équipe de service de production ainsi que les membres de l'équipe d'assistance à la clientèle qui ont pu être impliqués.
Passez en revue le résumé, examinez le calendrier et ajoutez les parties manquantes, puis passez aux idées de remédiation.
Ces questions sont formulées pour aider l'équipe à s'approprier le problème. Il y a certains problèmes qui semblent échapper au contrôle de l'équipe (centre de données perdant de l'énergie, etc.). Mais même dans de tels événements, l’équipe peut encore améliorer sa réaction face au désastre.
Étape 3 : Détecter – Comment détecter ce problème ou un problème similaire plus tôt ?
Supposez que ce problème ou un problème très similaire se reproduira. Comment l'équipe de service d’assistance peut-elle détecter ce problème plus rapidement et le trouver avant qu'un client ne le fasse ?
Étape 4 : Réagir – Comment pouvons-nous améliorer notre réponse à ce type de problème ?
Supposons que le ticket soit signalé. Quelle a été la rapidité de la réaction ? Des minutes ont-elles été perdues pendant que des personnes envoyaient des e-mails pour essayer d'amener quelqu'un à examiner le problème ?
La prochaine fois que ce ticket se produit, comment l'équipe peut-elle réagir plus rapidement ou de manière plus organisée ?
Étape 5 : Solution rapide – Comment arrêter l'hémorragie plus vite ?
Lorsque cela se produit de nouveau, y a-t-il une solution de contournement prête que nous puissions fournir au client pour réduire l'impact du problème ?
Si cela s'aggrave avec le temps (comme une attaque DDoS), avons-nous un moyen rapide de fermer les vannes pendant que nous identifions la cause principale ?
Étape 6 : Prévenir – Comment prévenir ou réduire l'impact de problèmes similaires à l'avenir ?
C'est souvent la seule question que les équipes posent lors d'un postmortem. C'est une question importante et vous devriez y passer beaucoup de temps. Cependant, si vous vous limitez à demander uniquement comment prévenir un ticket, cela vous permet de ne pas prendre de responsabilité pour les éléments sous votre contrôle (comme la manière dont vous détectez, réagissez ou corrigez rapidement un ticket).
Lorsque vous faites un brainstorming d'idées, ne vous limitez pas à des solutions techniques. Une meilleure surveillance, de meilleurs chemins de communication, de meilleures formations, s'assurer que les personnes du service client connaissent par nom les personnes du support de production, etc.
Étape 7 : Autres zones de risque – Quelles autres zones partagent cette même vulnérabilité ?
Chaque ticket est un indice de la faiblesse de votre système. Il y a de fortes chances que pour chaque ticket que vous trouvez, il y en ait des dizaines cachés dans l'ombre, encore à découvrir.
Un peu comme si vous voyez une souris dans votre cuisine. Vous n’avez pas un problème de « souris », mais un problème de « souris ».
Il est probable que d'autres parties du système partagent les mêmes hypothèses de conception ou, dans certains cas, le même code (bien que personne ne copierait/collerait jamais de code).
Passez quelques minutes à faire un brainstorming sur d'autres endroits qui sont vulnérables de manière similaire.
Lorsque les équipes sont stressées et surchargées de travail, elles passent cette étape. Je trouve qu'il s'agit de la question la plus importante à poser pour amener l'équipe à adopter un état d'esprit proactif et à réduire le nombre de problèmes à l'avenir.
Étape 8 : Prochaines étapes (Actions)
Après avoir identifié toutes les actions possibles pour améliorer la détection, la réaction, la correction rapide et la prévention des tickets, et trouvé les autres zones de votre application nécessitant une attention particulière, passez à la décision des actions à entreprendre.
La manière dont vous hiérarchisez cela dépend de vous. En revanche, j’ai quelques conseils à vous donner.
Obtenez un nom et une date pour chaque élément que vous projetez de traiter avant de quitter la réunion.
Si quelqu'un dans la réunion est passionné par la réalisation d'une des actions, encouragez-le, même si vous pensez que ce n'est peut-être pas la chose la plus importante à résoudre.
Noms et dates
En général, j’ai constaté que les équipes apprécient cet exercice (à condition que vous puissiez créer un environnement sans reproches pour la réunion). Ils aiment disséquer le problème et faire un brainstorming de solutions. Cependant, tout le monde se sent occupé et débordé. À moins que cette réunion ne se termine avec des propriétaires et des dates à côté des choses à faire, il est fort probable qu'aucune des améliorations ne se concrétise.
Ce qui va se passer, c'est que dans 3 semaines, lorsque le même problème se reproduira en production (mais cette fois de manière plus importante), quelqu'un dira : « Ah oui, nous avons parlé de le résoudre. » Pas un endroit idéal où être.
Pour pallier cela, assurez-vous simplement qu'il y a un nom et une date à côté de chaque action que le groupe veut entreprendre.
Basé sur le Blameless Postmortem Canvas de David Frink.
Commencer avec ce modèle maintenant.
Rétrospective - Été
Idéal pour:
Rétrospectives, La méthodologie Agile, Réunions
Le modèle de rétrospective - Summer propose une approche saisonnière et thématique des rétrospectives, parfaite pour capturer l'esprit de l'été. Il fournit des éléments pour réfléchir aux réalisations, aux expériences et aux objectifs dans le cadre estival. Ce modèle permet aux équipes de se détendre, de recharger et de réajuster leurs efforts pour la saison à venir. En promouvant la réflexion et le ressourcement, la Rétrospective - Eté permet aux équipes de célébrer les réussites, d'apprendre des revers et de se lancer dans de nouvelles aventures avec une énergie et un enthousiasme renouvelés, de manière efficace.
Jeu de pizza Kanban
Idéal pour:
Agile, Kanban
Le Kanban Pizza Game est un moyen interactif pour les équipes d'apprendre et d'appliquer les principes de Kanban. En simulant un processus de livraison de pizza, les équipes découvrent comment visualiser le travail, limiter le travail en cours et optimiser le flux. À travers des itérations et des réflexions, les participants acquièrent des insights sur l’amélioration continue et la pensée lean, favorisant la collaboration et stimulant l'efficacité. Préparez-vous à trancher dans l'inefficacité et à livrer de la valeur plus rapidement avec le jeu Kanban Pizza !
J'aime | Je souhaite | Je me demande
Idéal pour:
Agile
Les retours sont une partie essentielle de tout développement de projet et cruciale pour le processus itératif.
Modèle Feuille de Route DevOps
Idéal pour:
Documentation, Product Management, Software Development
Les équipes DevOps créent constamment du code, le répètent et le diffusent en direct. Dans ce contexte de développement continu, il peut être difficile de rester au courant de vos projets. Utilisez ce modèle Feuille de Route DevOps pour obtenir une vue granulaire du processus de développement de produits et de la manière dont il s'intègre dans la stratégie produit de votre organisation. La Feuille de Route DevOps présente les initiatives de développement et d'exploitation que vous avez planifiées à court terme, y compris les échéances et les dépendances. Ce format facile à utiliser est aisément assimilable par des publics tels que les équipes produits, développement et opérations informatiques.
Modèle PI Planning
Idéal pour:
Méthodologie Agile, Planification Stratégique, Développement de logiciels
Le PI Planning signifie « planification par incréments de programme ». Partie intégrante d'un Scaled Agile Framework (SAFe), le PI Planning aide les équipes à élaborer des stratégies vers une vision partagée. Au cours d'une session de PI Planning typique, les équipes se réunissent pour examiner un backlog de programme, s'aligner de manière polyvalente et décider des prochaines étapes. De nombreuses équipes organisent un événement de PI planning toutes les 8 à 12 semaines, mais vous pouvez personnaliser votre calendrier de planification en fonction de vos besoins. Utilisez le PI planning pour décomposer les fonctionnalités, identifier les risques, trouver les dépendances et décider quels récits vous allez développer.
Modèle d'échelle de Fibonacci
Idéal pour:
Méthodologie Agile, Prioritisation, Workflows Agile
Lorsque vous gérez une équipe, vous devez souvent estimer le temps et les efforts qu'il faudra pour accomplir les tâches. Essayez ce qui fonctionne souvent pour les équipes Agile du monde entier : tournez-vous vers l'échelle de Fibonacci pour obtenir des conseils. Basé sur la suite de Fibonacci, où chaque nombre est la somme des deux nombres précédents (0, 1, 2, 3, 5, 8, 13, 21, etc.), ce modèle peut vous aider à créer des chronologies comme un champion - vous aidant à vous assurer que le travail est réparti uniformément et que tout le monde est précis lors de l'estimation du travail et du temps impliqués dans un projet.